Graphs générés

La table misAct rassemble des charactéristiques calculées sur chacun des graphes générées.

  • nH : nombre de voisins de l’acteur manquant
  • mean.cpH : moyenne des corrélations partielles sortantes de l’acteur manquant
  • mean.vv : nombre moyen de voisins des voisins de l’acteur manquant
  • max.maxDeg : degré maximal parmi les voisins des voisins de l’acteur manquant
  • mean.maxDeg : moyenne des degrés maximaux des voisins de voisins de l’acteur manquant
  • mean.btw : moyenne des betweenness des voisins de l’acteur manquant
  • btwH : betweenness de l’acteur manquant.
nH mean.cpH mean.vv max.maxDeg mean.maxDeg mean.btw btwH
7 -0.3148500 1.285714 4 2.500000 0.4420290 69
4 -0.3311606 2.250000 3 2.333333 0.5384615 65
11 -0.2635695 1.181818 2 2.000000 0.4117647 85
7 -0.2813651 1.857143 2 1.333333 0.3586498 79
5 -0.3182708 2.000000 4 2.333333 0.4747475 66
4 -0.3732338 1.750000 3 2.000000 0.6186441 52

Les résultats sont résumés en regroupant les graphes par l’influence de leur acteur manquant :

  • minor : l’acteur manquant est lié à moins du tiers des noeuds (\(nH<5\))
  • medium : l’acteur manquant est lié à entre le tiers et la moitié des noeuds ( \(5 \leq nH < 7\))
  • major : l’acteur manquant est lié à plus de la moitié des noeuds (\(nH \geq 7\))
influence count
major 218
medium 158
minor 24

Convergence de VEMtree

Tous les VEMtree ont convergé, mais pas de la même manière. L’algo VEMtree a trois critères d’arrêt :

  • W et Omega convergent,
  • la borne inférieure converge,
  • maxIter a été atteint.

Donc VEMtree peut s’être arrêté du fait de la borne inf indépendemment de la convergence sur les paramètres W et Omega. Dans ce qui suit, on voit que maxIter (qui vaut 200) n’a jamais été atteint, et que lorsque c’est la convergence de J qui permet l’arrêt de l’algorithme, Omega a convergé mais pas W.

##        V1       
##  Min.   : 6.00  
##  1st Qu.: 8.00  
##  Median : 9.00  
##  Mean   :11.84  
##  3rd Qu.:13.00  
##  Max.   :55.00

Réseau et position de l’acteur manquant

La qualité d’inférence est évaluée avec l’AUC, la PPV (TP/(TP+FP)) et le TPR (TP/(TP+FN)) des arêtes incluant l’acteur manquant, notés PPVH et TPRH. Ces valeurs sont calculées pour chaque graphes, et les proportion de valeurs supérieures à 0.8 sont mises en liens avec le nombre de voisins nH de l’acteur manquant.

influence count med.auc auc.prop50
major 218 0.76 76.6
medium 158 0.54 57.0
minor 24 0.53 62.5
influence count med.ppvh med.tprh ppvh.prop50 tprh.prop50
major 218 0.75 0.70 73.4 69.3
medium 158 0.29 0.33 31.0 36.7
minor 24 0.14 0.25 0.0 16.7

Boxplots

Densities

VEMtree was unable to infer the missing actor in some case of major influence:

## $seed
##  [1]  10  12  19  20  31  40  41  43  44  60  69  71  80  81  91  94  99
## [18] 108 117 126 139 152 155 159 172 176 178 186 204 226 236 245 246 247
## [35] 251 253 254 271 292 305 312 313 327 341 352 353 358 374 376 379 384
## [52] 395

AUC vs PPVH

AUC vs TPRH

PPVH vs TPRH

Reconstruction de l’acteur manquant

La reconstruction de l’acteur manquant est évaluée par la corrélation entre le vecteur latent gaussien d’origine \(Z_H\), et le vecteur des moyennes inférées \(M_H\).

influence med.cor prop50
major 0.78 83.9
medium 0.47 49.4
minor 0.34 25.0

VEMtree was unable to reconstruct missing actor in some major influence cases :

##  [1]  10  12  31  40  41  43  44  60  80  81  91  94 108 117 152 155 159
## [18] 172 178 186 236 245 247 254 271 292 305 312 313 341 352 353 358 376
## [35] 379

Pourquoi plusieurs groupes

Etude de J, Jcor, Icl et diffJPLN en fonction de AUC, PPVH et corZM

AUC

PPVH

corZM

TPRH

Caractéristiques des graphes

J et Jcor

AUC

PPVH

corZM

TPRH